智能论文笔记

A Concurrent CNN-RNN Approach for Multi-Step Wind Power Forecasting

Syed Kazmi , Berk Gorgulu , Mucahit Cevik , Mustafa Gokce Baydogan

分类：机器学习

2023-01-02

Wind power forecasting helps with the planning for the power systems by contributing to having a higher level of certainty in decision-making. Due to the randomness inherent to meteorological events (e.g., wind speeds), making highly accurate long-term predictions for wind power can be extremely difficult. One approach to remedy this challenge is to utilize weather information from multiple points across a geographical grid to obtain a holistic view of the wind patterns, along with temporal information from the previous power outputs of the wind farms. Our proposed CNN-RNN architecture combines convolutional neural networks (CNNs) and recurrent neural networks (RNNs) to extract spatial and temporal information from multi-dimensional input data to make day-ahead predictions. In this regard, our method incorporates an ultra-wide learning view, combining data from multiple numerical weather prediction models, wind farms, and geographical locations. Additionally, we experiment with global forecasting approaches to understand the impact of training the same model over the datasets obtained from multiple different wind farms, and we employ a method where spatial information extracted from convolutional layers is passed to a tree ensemble (e.g., Light Gradient Boosting Machine (LGBM)) instead of fully connected layers. The results show that our proposed CNN-RNN architecture outperforms other models such as LGBM, Extra Tree regressor and linear regression when trained globally, but fails to replicate such performance when trained individually on each farm. We also observe that passing the spatial information from CNN to LGBM improves its performance, providing further evidence of CNN's spatial feature extraction capabilities.

translated by 谷歌翻译

Meet-in-the-middle: Multi-scale upsampling and matching for cross-resolution face recognition

Klemen Grm , Berk Kemal Özata , Vitomir Štruc , Hazım Kemal Ekenel

分类：计算机视觉

2022-11-28

In this paper, we aim to address the large domain gap between high-resolution face images, e.g., from professional portrait photography, and low-quality surveillance images, e.g., from security cameras. Establishing an identity match between disparate sources like this is a classical surveillance face identification scenario, which continues to be a challenging problem for modern face recognition techniques. To that end, we propose a method that combines face super-resolution, resolution matching, and multi-scale template accumulation to reliably recognize faces from long-range surveillance footage, including from low quality sources. The proposed approach does not require training or fine-tuning on the target dataset of real surveillance images. Extensive experiments show that our proposed method is able to outperform even existing methods fine-tuned to the SCFace dataset.

translated by 谷歌翻译

Robot-Assisted Drilling on Curved Surfaces with Haptic Guidance under Adaptive Admittance Control

Alireza Madani , Pouya P. Niaz , Berk Guler , Yusuf Aydin , Cagatay Basdogan

分类：机器人

2022-07-28

由于钻孔对准的困难以及任务的固有不稳定性，在手动完成时，在弯曲的表面上钻一个孔很容易失败，可能会对工人造成伤害和疲劳。另一方面，在实际制造环境中充分自动化此类任务可能是不切实际的，因为到达装配线的零件可以具有各种复杂形状，在这些零件上不容易访问钻头位置，从而使自动化路径计划变得困难。在这项工作中，开发并部署了一个具有6个自由度的自适应入学控制器，并部署在Kuka LBR IIWA 7配件上，使操作员能够用一只手舒适地在机器人上安装在机器人上的钻头，并在弯曲的表面上开放孔，并在弯曲的表面上开放孔。通过AR界面提供的玉米饼和视觉指导的触觉指导。接收阻尼的实时适应性在自由空间中驱动机器人时，可以在确保钻孔过程中稳定时提供更高的透明度。用户将钻头足够靠近钻头目标并大致与所需的钻探角度对齐后，触觉指导模块首先对对齐进行微调，然后将用户运动仅限于钻孔轴，然后操作员仅将钻头推动钻头以最小的努力进入工件。进行了两组实验，以定量地研究触觉指导模块的潜在好处（实验I），以及根据参与者的主观意见（实验II），提出的用于实际制造环境的PHRI系统的实际价值。

translated by 谷歌翻译

Learning from few examples: Classifying sex from retinal images via deep learning

Aaron Berk , Gulcenur Ozturan , Parsa Delavari , David Maberley , Özgür Yılmaz , Ipek Oruc

分类：计算机视觉 | 机器学习

2022-07-20

深度学习对医学成像产生了极大的兴趣，特别是在使用卷积神经网络（CNN）来开发自动诊断工具方面。其非侵入性获取的设施使视网膜底面成像适合这种自动化方法。使用CNN分析底面图像的最新工作依靠访问大量数据进行培训和验证 - 成千上万的图像。但是，数据驻留和数据隐私限制阻碍了这种方法在患者机密性是任务的医疗环境中的适用性。在这里，我们展示了小型数据集上DL的性能的结果，以从眼睛图像中对患者性别进行分类 - 直到最近，底眼前图像中才出现或可量化的特征。我们微调了一个RESNET-152模型，其最后一层已修改以进行二进制分类。在几个实验中，我们使用一个私人（DOV）和一个公共（ODIR）数据源评估在小数据集上下文中的性能。我们的模型使用大约2500张底面图像开发，实现了高达0.72的AUC评分（95％CI：[0.67，0.77]）。尽管与文献中的先前工作相比，数据集大小降低了近1000倍，但这仅仅是降低25％的性能。即使从视网膜图像中进行性别分类等艰巨的任务，我们也会发现使用非常小的数据集可以进行分类。此外，我们在DOV和ODIR之间进行了域适应实验。探索数据策展对培训和概括性的影响；并调查模型结合在小型开发数据集中最大化CNN分类器性能。

translated by 谷歌翻译

A coherence parameter characterizing generative compressed sensing with Fourier measurements

Aaron Berk , Simone Brugiapaglia , Babhru Joshi , Yaniv Plan , Matthew Scott , Özgür Yilmaz

分类：机器学习 | (统计)机器学习

2022-07-19

在Bora等。（2017年），在测量矩阵为高斯，信号结构是生成神经网络（GNN）的范围的设置中开发了一个数学框架，用于压缩传感保证。此后，当测量矩阵和/或网络权重遵循Subgaussian分布时，对GNNS进行压缩感测的问题进行了广泛的分析。我们超越了高斯的假设，以通过在单一基质的随机行中均匀地采样（包括作为特殊情况下的亚采样傅立叶测量值）来得出的测量矩阵。具体而言，我们证明了使用亚次采样的二型限制感测的第一个已知的限制等轴测保证，并提供了几乎有序的样品复杂性的恢复边界，解决了Scarlett等人的开放问题。（2022，第10页）。恢复功效的特征是连贯性，这是一个新参数，该参数测量了网络范围与测量矩阵之间的相互作用。我们的方法依赖于子空间计数论点和思想的核心概率。此外，我们提出了一种正规化策略，以使GNN与测量运算符具有有利的连贯性。我们提供令人信服的数值模拟来支持这种正规训练策略：我们的策略产生低相干网络，需要更少的信号回收测量。这与我们的理论结果一起支持连贯性作为自然量，用于表征与亚次采样的生成压缩感测。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

Predictive Multiplicity in Probabilistic Classification

Jamelle Watson-Daniels , David C. Parkes , Berk Ustun

分类：机器学习

2022-06-02

对于任何给定的预测任务，可能存在多个模型几乎同样出色的模型。我们研究了这些竞争模型的预测如何变化。特别是，我们研究了概率分类的预测性多样性。我们正式定义了我们的设置措施，并开发基于优化的方法来计算这些措施，以实现经验风险最小化问题。我们运用我们的方法来深入了解为什么出现预测性多样性。我们证明了在现实世界风险评估任务中预测多样性的发生率和流行率。我们的结果强调需要更广泛地报告多重性。

translated by 谷歌翻译

Rank List Sensitivity of Recommender Systems to Interaction Perturbations

Sejoon Oh , Berk Ustun , Julian McAuley , Srijan Kumar

分类：机器学习

2022-01-29

预测模型可以表现出对培训数据的敏感性：训练数据中的微小变化可以产生在测试时间期间为单个数据点分配相互矛盾的预测的模型。在这项工作中，我们研究了推荐系统中的这种敏感性，其中用户的建议在其他无关用户的交互中受到较小的扰动的巨大改变。我们介绍了推荐系统的稳定性度量，称为等级列表灵敏度（RLS），该量度衡量了由于培训数据中的扰动而导致的测试时间变化时在测试时间变化时如何生成的等级列表。我们开发了一种方法，即Casper，该方法使用级联效应来识别最小和系统的扰动，以在推荐系统中诱导更高的不稳定性。四个数据集的实验表明，推荐模型对引入或通过Casper引入的次要扰动过于敏感 - 甚至将一个用户的一个随机交互扰动会大大更改所有用户的建议列表。重要的是，借助Casper扰动，这些模型比高准确性的使用者（即那些接受低质量建议的人）为低临界用户（即那些接受低质量建议的人）产生更多的不稳定建议。

translated by 谷歌翻译

Learning Optimal Predictive Checklists

Haoran Zhang , Quaid Morris , Berk Ustun , Marzyeh Ghassemi

分类：机器学习

2021-12-02

清单是简单的决策辅助工具，通常用于促进临床应用中的安全性和可靠性。在本文中，我们提出了一种学习临床决策支持清单的方法。我们代表预测检查表作为具有二进制特征和单位权重的离散线性分类器。然后，我们通过解决整数编程问题，从数据中了解全局最佳预测检查表。我们的方法允许用户自定义检查表以遵循复杂的约束，包括对实施组公平性的约束，并在培训时间进行二共度实际功能。此外，它对具有最优性差距的模型，可以为模型开发提供信息，并确定在给定数据集上的充分准确检查表的可行性。我们将我们的方法与专业技术配对，加速其培训能够良好的预测检查表的能力，并且具有小的最优性差距。我们在七个临床分类问题上基准测试我们的方法，并通过培训用于接触前置筛查的短型清单来展示其实用益处。我们的结果表明，我们的方法可以适用于简单的预测检查表，可以很好地表现良好，可以轻松定制，以遵守丰富的自定义约束。

translated by 谷歌翻译

Prediction of new outlinks for focused crawling

Thi Kim Nhung Dang , Doina Bucur , Berk Atil , Guillaume Pitel , Frank Ruis , Hamidreza Kadkhodaei , Nelly Litvak

分类：机器学习

2021-11-09

发现新的超链接使Web爬网程序能够找到尚未索引的新页面。这对于集中的爬行者来说尤为重要，因为他们努力提供对网络的特定部分的全面分析，从而优先考虑发现内容的变化的新页面。在文献中，通常同时考虑超链接和内容的变化。但是，还有证据表明这两种改变不一定是相关的。此外，关于预测变化的许多研究假设页面的长期可用，这在实践中是无法实现的。这项工作的目的是提供一种方法来使用短历史有效地检测新的链接。为此，我们使用一周的间隔使用十个爬网的数据集。我们的研究包括三个部分。首先，我们通过分析新的倒出数量的经验属性来获得数据的洞察力。我们观察到这些属性平均随着时间的推移稳定，但在目标页面内外页面的超链接出现的超链接之间存在很大的差异（分别分别是内部和外部倒降）。接下来，我们为三个目标提供统计模型：链路变化率，新链接的存在以及新链接的数量。这些模型包括文献中早些时候使用的功能，以及在这项工作中引入的新功能。我们分析了特征之间的相关性，并调查了他们的信息。一个值得注意的发现是，如果目标页面的历史不可用，那么我们的新功能，代表相关页面的历史，对于目标页面中的新链接最预测。最后，我们将排名方法作为聚焦爬虫的准则，以有效地发现新页面，这对相应的目标实现了出色的性能。

translated by 谷歌翻译